Topological data analysis (TDA) is a branch of computational mathematics, bridging algebraic topology and data science, that provides compact, noise-robust representations of complex structures. Deep neural networks (DNNs) learn millions of parameters associated with a series of transformations defined by the model architecture, resulting in high-dimensional, difficult-to-interpret internal representations of input data. As DNNs become more ubiquitous across multiple sectors of our society, there is increasing recognition that mathematical methods are needed to aid analysts, researchers, and practitioners in understanding and interpreting how these models' internal representations relate to the final classification. In this paper, we apply cutting edge techniques from TDA with the goal of gaining insight into the interpretability of convolutional neural networks used for image classification. We use two common TDA approaches to explore several methods for modeling hidden-layer activations as high-dimensional point clouds, and provide experimental evidence that these point clouds capture valuable structural information about the model's process. First, we demonstrate that a distance metric based on persistent homology can be used to quantify meaningful differences between layers, and we discuss these distances in the broader context of existing representational similarity metrics for neural network interpretability. Second, we show that a mapper graph can provide semantic insight into how these models organize hierarchical class knowledge at each layer. These observations demonstrate that TDA is a useful tool to help deep learning practitioners unlock the hidden structures of their models.
translated by 谷歌翻译
用于图像分类的深神经网络通常使用卷积过滤器来提取区分特征,然后再将其传递到线性分类器。大多数可解释性文献都集中在为卷积过滤器提供语义含义,以解释模型的推理过程,并确认其从输入域中使用相关信息。可以通过使用单数值分解分解其重量矩阵来研究完全连接的层,实际上研究每个矩阵中的行之间的相关性以发现地图的动力学。在这项工作中,我们为卷积层的重量张量定义了一个奇异的值分解,该分解器提供了对过滤器之间的相关性的类似理解,从而揭示了卷积图的动力学。我们使用随机矩阵理论中的最新结果来验证我们的定义。通过在图像分类网络的线性层上应用分解,我们建议一个框架,可以使用HyperGraphs应用可解释性方法来模型类别分离。我们没有寻找激活来解释网络,而是使用每个线性层具有最大相应奇异值的奇异向量来识别对网络最重要的特征。我们用示例说明了我们的方法,并介绍了本研究使用的分析工具DeepDataProfiler库。
translated by 谷歌翻译
Researchers produce thousands of scholarly documents containing valuable technical knowledge. The community faces the laborious task of reading these documents to identify, extract, and synthesize information. To automate information gathering, document-level question answering (QA) offers a flexible framework where human-posed questions can be adapted to extract diverse knowledge. Finetuning QA systems requires access to labeled data (tuples of context, question and answer). However, data curation for document QA is uniquely challenging because the context (i.e. answer evidence passage) needs to be retrieved from potentially long, ill-formatted documents. Existing QA datasets sidestep this challenge by providing short, well-defined contexts that are unrealistic in real-world applications. We present a three-stage document QA approach: (1) text extraction from PDF; (2) evidence retrieval from extracted texts to form well-posed contexts; (3) QA to extract knowledge from contexts to return high-quality answers -- extractive, abstractive, or Boolean. Using QASPER for evaluation, our detect-retrieve-comprehend (DRC) system achieves a +7.19 improvement in Answer-F1 over existing baselines while delivering superior context selection. Our results demonstrate that DRC holds tremendous promise as a flexible framework for practical scientific document QA.
translated by 谷歌翻译
包括无人驾驶汽车(UAV)在内的自动移动机器人因其在建筑中的应用而受到了极大的关注。这些平台具有极大的潜力,可以自动化和增强许多任务所需数据的质量和频率,例如施工时间表更新,检查和监视。强大的本地化是可靠部署自动机器人平台的关键推动力。自动化的机器人解决方案主要依靠全球定位系统(GPS)进行户外定位。但是,GPS信号在室内被拒绝,并且经常使用预建的环境图来室内定位。这需要通过对环境中的移动机器人进行远程操作来产生高质量的地图。这种方法不仅耗时且乏味,而且在室内建筑环境中也是不可靠的。布局随着施工的进度而变化,需要频繁的映射会话来支持自主任务。此外,依赖视觉特征的基于视觉解决方案的有效性在现场低质地和重复区域都受到高度影响。为了应对这些挑战,我们以前提出了使用Apriltags的低成本,轻巧的基于标签的视觉惯性定位方法。在这种方法中,标签是具有已知尺寸和位置的纸张可打印地标,代表环境的准图。由于标签放置/更换是一个手动过程,因此它会遭受人体错误。在这项工作中,我们研究了人体错误在手动标签安装过程中的影响,并提出了一种随机方法,以使用谎言组理论来解决这种不确定性。使用蒙特卡洛模拟,我们通过实验表明,在我们的Manifold配方中纳入的拟议随机模型可提高基于标签的定位对在现场手动标签安装中不可避免的瑕疵的鲁棒性和准确性。
translated by 谷歌翻译
本文提出了一个分类模型,用于根据其平衡来预测比特币地址的主要活动。由于余额是时间的函数,因此我们应用功能数据分析的方法;更具体地说,提出的分类模型的特征是数据的功能主组件。分类比特币地址是一个相关问题,其主要原因是:了解比特币市场的组成,并确定用于非法活动的地址。尽管已经提出了其他比特币分类器,但它们主要关注网络分析而不是曲线行为。另一方面,我们的方法不需要任何网络信息进行预测。此外,与专家构建的功能不同,功能功能具有直接构建的优势。结果表明,当将功能特征与标量特征相结合时,使用这些功能分别将功能特征与标量特征相似,而对于模型分别使用这些功能,这表明功能模型是当域特异性知识时是一个不错的选择。
translated by 谷歌翻译
溶剂基碳捕获系统(CCSS)中的CO2捕获效率尺寸依赖性取决于气体溶剂界面(IA),使IA在CCS设计中的基础攻击最大化。虽然可以通过计算流体动力学(CFD)仿真估计与特定CCS设计的IA,但是使用CFD导出与许多CCS设计相关的IAS,这是昂贵的。幸运的是,以前的工作(如深液)(DF)(Kim等人,2019)表明,通过用神经网络(NN)代理商兑忠实地模仿CFD仿真过程的CFD模拟器来实现大型仿真加速度。这提高了对CFD模拟器的快速,准确更换的可能性,从而有效地逼近CCS设计优化所需的IAS。因此,在这里,我们建立在DF方法中,以开发成功应用于我们复杂的碳捕获CFD模拟的代理。我们优化的DF样式替代商会产生大型加速(4000X),同时获得位于训练配置范围内的未见CCS配置中的IA相对误差低至4%。这提示了NN代理人的CCS设计优化问题的承诺。尽管如此,DF对CCS设计具有固有的局限性(例如,培训模型的有限可转换性至新CCS填料)。我们与思想结束以解决这些挑战。
translated by 谷歌翻译
无线通信的机器学习(ML)应用程序在标准化讨论中获得了5G先进及更远的标准化讨论的势头。真实世界ML部署的最大挑战之一是需要标记信号和大型测量运动。为了克服这些问题,我们建议使用未经训练的神经网络(UNNS)用于MIMO信道娱乐/估计和低开销报告。 UNN通过拟合一些频道测量来学习传播环境,并在提供更高的信道估计收益之前利用他们的学习。此外,我们为多个用户提供了一个UNN,用于多个用户的同时频道娱乐,或多个用户设备(UE)位置,其中我们在估计的信道增益和参数的数量之间具有权衡。我们的结果表明,转移学习技术有效地在环境结构之前访问了学习,因为它们为邻近用户提供了更高的信道增益。此外,我们表示如何进一步启用低开销信道状态信息(CSI)报告的参数化程度。
translated by 谷歌翻译
对信道状态信息(CSI)的知识是移动无线通信系统中的许多功能的基础。随着机器学习(ML)和数字地图的前进,即数字双胞胎,我们有一个很大的机会来学习传播环境和设计新的方法来派生和报告CSI。在这项工作中,我们建议根据先前知识将未经训练的神经网络(UNNS)和有条件的生成对冲网络(CGANs)用于MIMO信道娱乐。 UNNS为某些位置学习先前的CSI,该位置用于构建CGAN的输入。基于先前的CSI,其位置和所需信道的位置,CGAN被训练以输出所需位置的通道。这种组合的方法可用于低开销CSI报告作为培训后,我们只需要报告所需的位置。我们的研究结果表明,我们的方法成功地建模无线信道和鲁棒在视线条件下的位置量化误差。
translated by 谷歌翻译
黑人生活问题(BLM)是一项分散的社会运动,抗议对黑人个人和社区的暴力行为,重点是警察暴力。 2020年,艾哈迈德·阿贝里(Ahmaud Arbery),布雷纳·泰勒(Breonna Taylor)和乔治·弗洛伊德(George Floyd)的杀害后,该运动引起了人们的关注。#BlackLivesMatter社交媒体标签已经代表了基层运动,并以类似的标签来抗议BLM运动,例如#AllllivesMatter和#allllivesmatter和#allllivesmatter,以及#bluelivesmatter。我们介绍了来自100多个国家 /地区的1,300万用户的6390万推文的数据集,其中包含以下关键字之一:BlackLivesMatter,AlllivesMatter和BluelivesMatter。该数据集包含从2013年BLM运动开始到2021年的所有当前可用推文。我们总结了数据集并显示了使用BlackLivesMatter关键字和与反向运动相关的关键字的时间趋势。此外,对于每个关键字,我们创建并发布了一组潜在的Dirichlet分配(LDA)主题(即自动聚集了语义上共同共的单词的组),以帮助研究人员识别这三个关键字的语言模式。
translated by 谷歌翻译